iT邦幫忙

2022 iThome 鐵人賽

DAY 14
0
自我挑戰組

商業數據分析應用系列 第 14

[Day14] 分析項目梳理

  • 分享至 

  • xImage
  •  

今天的目標是來統整一下這幾天的分析項目,準備為資料可視化做準備,視覺化部分應該會使用Seaborn套件和Google Data Studio來呈現
除了個人覺得Seaborn比較好看之外/images/emoticon/emoticon01.gif,這次的資料有包含座標的部分,我覺得丟到Data Studio上會是一個不錯的選擇。


  • Raw Data: Case Study Bike-Share Company's 12 months data(Chicago, USA)
  • 時間區間: 2020.01~2020.03
  • 資料筆數: 未清理前426,887筆;有效資料419,215筆。
  • 分析目的: 找出能讓新客(casual)轉為會員(member)的契機
  1. 騎乘總時間:
  • 分為1min~1hr, 1hr~12hrs, 12hrs up三組,資料以短程租借居多,比例佔98%。
  • 以短程為主的使用者,最頻繁租借點接鄰近市區/交通要道/觀光景點,而最少租借點多未於偏郊區或附近沒有交通站點之處。
  • 小於1min的使用者,我將他們歸類為操作錯誤,因為都同站租同站還。
  1. 使用者(會員/非會員):
  • 不重複使用者419,199筆;重複使用者16筆。
  • 不重複使用者中,374,670筆是會員;44,529筆是非會員。
  • 因資料不足,沒有更多像是姓名或電話等使用者資訊,較無法計算使用過從非會員>會員的轉換率(CR)。
  1. DoW:
  • 三個月以來,週間的使用頻率高,以禮拜三次數最多
  • 將進一步拆解主要是分布在哪個時段(凌晨/早上/中午/晚上),以下午時段191,446筆最多(計算方式已更新於Day13!)。

TOMORROW 's Goal

長條/圓餅/折線圖的視覺化呈現。
思考更多資料的可能性。

明天會進入視覺化的部分,先以基本的長條/圓餅/折線做發揮。
順便也會發想看看這次需不需要加入ML的部分。/images/emoticon/emoticon33.gif
明天見!


上一篇
[Day13] SQL語法練習
下一篇
[Day15] 資料視覺化(I)-seaborn/matplotlib
系列文
商業數據分析應用30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言